2024-10

增强现实安全警告的神经关联:道路工作区情境意识和认知表现的脑电图分析

分类: 人机交互, 新兴技术

作者: Fatemeh Banani Ardecani, Amit Kumar, Sepehr Sabeti, Omidreza Shoghli

发布时间: 2024-10-17

链接: http://arxiv.org/abs/2410.13623v1

摘要: 尽管研究和实施工作涉及各种安全策略、协议和技术,但工作区事故和死亡事件每年仍然以惊人的速度发生。本研究调查了不同工作负载条件下道路工作区对增强现实安全警告的神经生理学反应。利用脑电图(EEG)技术,我们客观地评估了模拟低强度(LA)和中等强度(MA)工作活动中的情境意识、注意力和认知负荷。该研究分析了关键的脑电图指标,包括 β、γ、α 和 θ 波,以及各种组合波比率。结果显示,AR 警告有效地触发了与两种工作负载条件下的情境意识和注意力增强相关的神经系统反应。然而,这些反应的时间和强度存在显着差异。在洛杉矶条件下,峰值反应发生得更早(警告后 125 毫秒内)并且更明显,这表明当身体需求较低时,认知反应更强烈。相反,MA 状况显示延迟的峰值响应(警告后 125-250 毫秒)和更渐进的变化,表明体力活动增加对认知处理速度的潜在影响。这些发现强调了在为道路工作区设计基于 AR 的安全系统时考虑体力工作量的重要性。该研究有助于了解 AR 如何增强工人安全,并为在高风险工作环境中开发更有效、情境感知的安全干预措施提供见解。

EOSpython版本0.0.11:场景生成框架和敏捷对地观测卫星调度问题的解决系统

分类: 优化与控制, 天体物理学仪器和方法, 新兴技术, 数值分析, 编程语言, 数值分析, 05, 15, 65, 68, 90, G.1; G.2; I.6; J.2

作者: Alex Elkjær Vasegaard, Andreas Kühne Larsen

发布时间: 2024-10-17

链接: http://arxiv.org/abs/2410.13462v1

摘要: EOSpython 是一个 PyPI 发布的 Python 包,涵盖集中式地球观测卫星调度系统中的所有内容,包括客户数据库设置、场景生成、预处理、问题设置、调度解决方案方法、决策者偏好集成和可视化。该软件包经过定制,可以轻松配置内部参数并与其他解决方案方法一起使用。

使用 Bloch Sphere 方法和 IBM Native Gates 经济高效地实现 IBM 量子计算机的 n 位 Toffoli 门

分类: 量子物理学, 新兴技术

作者: Ali Al-Bayaty, Marek Perkowski

发布时间: 2024-10-17

链接: http://arxiv.org/abs/2410.13104v1

摘要: 建议根据 IBM 量子计算机的布局(线性、T 型和 I 型)和 n 个物理量子位的数量来实现(或转译)一种经济高效的 n 位 Toffoli 门。这个提议的门被称为“布局感知 n 位 Toffoli 门”。布局感知的 n 位 Toffoli 门是使用 Bloch 球体的视觉方法设计的,源自 IBM 本机门的旋转量子操作的视觉表示。在本文中,我们还提出了一个新的量子成本公式,该公式计算本机门的总数、交叉连接以及最终转译量子电路的深度。该公式称为“转译量子成本”。在转译之后,我们提出的布局感知 n 位 Toffoli 门总是比传统的 n 位 Toffoli 门具有低得多的转译量子成本,其中对于不同的 IBM 量子计算机,3 <= n <= 7 量子位。

LFOsum:用大型语言模型总结长篇观点

分类: 计算和语言, 人工智能, 新兴技术, 人机交互, 信息检索

作者: Mir Tafseer Nayeem, Davood Rafiei

发布时间: 2024-10-16

链接: http://arxiv.org/abs/2410.13037v1

摘要: 在线评论在影响从购买产品到选择酒店或餐厅等各个领域的消费者决策方面发挥着关键作用。然而,大量的评论(通常包含重复或不相关的内容)会导致信息过载,使用户难以提取有意义的见解。传统的意见摘要模型在处理长输入和大量评论方面面临挑战,而较新的大型语言模型(LLM)方法通常无法生成准确和忠实的摘要。为了应对这些挑战,本文引入了 (1) 一个新的长格式用户评论数据集,每个实体包含超过一千条评论,(2) 两种无需训练的基于 LLM 的摘要方法,可扩展到长输入,以及 (3 )自动评估指标。我们的用户评论数据集与领域专家的深入且公正的批评摘要相结合,作为评估的参考。此外,我们新颖的无参考评估指标提供了对摘要忠实度更精细、上下文敏感的评估。我们使用我们的方法对多个开源和闭源大语言模型进行基准测试。我们的评估表明,大语言模型在平衡长篇摘要中的情绪和格式遵循方面仍然面临挑战,尽管开源模型可以缩小以集中方式检索相关信息时的差距。

量子计算机的模拟:回顾和加速机会

分类: 量子物理学, 新兴技术

作者: Alessio Cicero, Mohammad Ali Maleki, Muhammad Waqar Azhar, Anton Frisk Kockum, Pedro Trancoso

发布时间: 2024-10-16

链接: http://arxiv.org/abs/2410.12660v1

摘要: 量子计算有潜力通过解决当前经典计算机无法在合理时间内解决的复杂问题来彻底改变多个领域。然而,量子计算机的发展仍处于早期阶段,可用系统的资源仍然非常有限。因此,目前开发和测试量子算法最实用的方法是使用量子计算机的经典模拟器。此外,新型量子计算机及其组件的开发也依赖于模拟。鉴于量子计算机的特性,其模拟在计算和存储方面都是一个非常苛刻的应用。因此,模拟在当前的经典系统中不能很好地扩展。因此,需要在不同级别应用不同的优化和近似技术。这篇综述概述了量子计算机的组件、这些组件和整个量子计算机的模拟级别,并对不同的最先进加速方法进行了深入分析。除了可以在算法级别执行的优化之外,本综述还介绍了最有前途的硬件感知优化以及可以探索的未来方向,以提高模拟的性能和可扩展性。

实现数据驱动和移情交互:混合现实中的上下文感知 3D 虚拟代理,以增强金融客户体验

分类: 人机交互, 人工智能, 新兴技术, 多媒体, H.5.1; K.4.3

作者: Cindy Xu, Mengyu Chen, Pranav Deshpande, Elvir Azanli, Runqing Yang, Joseph Ligman

发布时间: 2024-10-15

链接: http://arxiv.org/abs/2410.12051v1

摘要: 在本文中,我们介绍了一种新颖的系统,旨在通过上下文感知的 3D 虚拟代理,利用混合现实 (MR) 和视觉语言模型 (VLM) 来增强金融和零售领域的客户服务。我们的方法侧重于实现数据驱动和同理心交互,通过引入物理位置的态势感知、基于客户资料的个性化交互以及严格的隐私和安全标准来确保客户满意度。我们讨论了对于实际客户服务环境中的部署至关重要的设计考虑因素,解决了用户数据管理和敏感信息处理方面的挑战。我们还概述了银行和零售环境特有的系统架构和关键功能。我们的工作展示了在服务行业中集成 MR 和 VLM 的潜力,提供客户服务交付方面的实用见解,同时保持高标准的安全性和个性化。

抗噪声化学反应网络训练人工神经网络

分类: 分子网络, 新兴技术, 化学物理, 92B05, 92B20

作者: Sunghwa Kang, Jinsu Kim

发布时间: 2024-10-15

链接: http://arxiv.org/abs/2410.11919v1

摘要: 人工神经网络(NN)可以使用化学反应网络(CRN)来实现,其中物种的浓度充当输入和输出。在这种生化计算中,由于化学反应中存在内在和外在噪声,抗噪声计算至关重要。之前建议的前馈网络 CRN 通常使用修正线性单元 (ReLU) 或离散激活函数。然而,这种情况下的一个问题是这些非平滑函数的导数的不连续性,这可能会在反向传播期间导致显着的噪声干扰。在本研究中,我们提出了一种 CRN,它使用平滑激活函数执行前馈和训练过程,以避免反向传播中的不连续性。所有反应都发生在一个锅中,并且训练反应是双分子的。我们对 XOR、Iris、MNIST 数据集和非线性回归模型的案例研究表明,通过 CRN 进行的计算 (i) 尽管反应速率和物种浓度存在噪声,但仍保持准确性,并且 (ii) 对选择的选择不敏感与具有非平滑激活函数的神经网络相比的运行时间和噪声大小。这项工作提出了一种用于完整神经网络计算(包括反向传播)的抗噪声 CRN,为更稳定、更高效的生化计算系统铺平了道路。

植物间压力通讯的端到端数学建模

分类: 新兴技术

作者: Ahmet B. Kilic, Ozgur B. Akan

发布时间: 2024-10-15

链接: http://arxiv.org/abs/2410.11790v1

摘要: 分子通讯(MC)是自然界中发现的一种重要的通讯范式。基于气味的分子通讯(OMC)是一种特殊类型的分子通讯,具有广阔的前景和广泛的应用前景。在本文中,我们研究了胁迫通信背景下植物之间的 OMC 通信。具体来说,我们探索植物如何利用生物挥发性有机化合物(BVOC)向邻近植物传达它们正在经历的压力信息。我们构建了一个端到端的数学模型,可以发现影响压力交流的潜在物理和生物现象。据我们所知,这是第一项模拟这种端到端压力沟通的研究。我们使用 MATLAB 对不同场景下的系统进行了数值分析。利用文献中的实验数据,我们证明了连续的基因调控可以近似不同胁迫条件下植物中 BVOC 的排放量。因此,我们将此模型应用于这些压力源和植物,以准确估算 BVOC 排放量。我们还研究了植物用来发送信息的调制方法,即比率移位键控。通过分析该方法,我们发现它通过启用多访问通道并防止竞争对手工厂获取信息而使工厂受益。

内存计算交叉开关上节能非结构化稀疏 DNN 的排序权重分段

分类: 硬件架构, 人工智能, 新兴技术, 机器学习

作者: Matheus Farias, H. T. Kung

发布时间: 2024-10-15

链接: http://arxiv.org/abs/2410.11298v1

摘要: 我们引入$\textit{排序权重分段}$(SWS):一种权重分配算法,将排序的深度神经网络(DNN)权重部分放置在位片内存计算(CIM)交叉开关上,以减少模拟到数字的转换转换器(ADC)能耗。数据转换是交叉操作中最耗能的过程。 SWS 利用 (1) 小权重和 (2) 零权重(权重稀疏性)有效降低了这种成本。 DNN 权重遵循钟形分布,大多数权重接近于零。使用 SWS,我们只需要低阶交叉柱用于具有低幅度权重的部分。这减少了所用 ADC 的数量和分辨率,从而以指数方式降低 ADC 能源成本,而不会显着降低 DNN 精度。非结构化稀疏化进一步锐化了权重分布,且精度损失较小。然而,它在零的硬件跟踪方面提出了挑战:在没有索引匹配的情况下,我们无法将零行切换到未排序交叉开关中的其他层权重。 SWS 使用将零线离线重新映射到早期部分来有效地解决非结构化稀疏模型,这揭示了稀疏性的全部潜力并最大限度地提高了能源效率。我们的方法在非结构化稀疏 BERT 模型上将 ADC 能耗减少了 89.5%。总体而言,本文介绍了一种新颖的算法来促进非结构化稀疏 DNN 工作负载的节能 CIM 交叉开关。

BRC20 锁定攻击

分类: 密码学和安全, 计算工程、金融和科学, 新兴技术

作者: Minfeng Qi, Qin Wang, Zhipeng Wang, Lin Zhong, Tianqing Zhu, Shiping Chen, William Knottenbelt

发布时间: 2024-10-15

链接: http://arxiv.org/abs/2410.11295v1

摘要: BRC20 代币是比特币网络上的一种不可替代资产。它们允许用户在比特币聪中嵌入定制内容。过去一年(2023Q3-2024Q3)相关代币热潮的市场规模已达到 3,650b 美元。然而,这种直观的设计并没有经过严格的安全审查。我们首次对 BRC20 传输机制进行深入分析,并确定了关键的攻击向量。典型的 BRC20 转账涉及两个具有不同费用水平的捆绑链上交易:第一个费用较低的交易(即 Tx1)记录转账请求,而第二个费用较高的交易(即 Tx2)完成实际转账。我们发现对手可以通过发送受操纵的费用交易(落在两个费用水平之间)来利用这一点,这使得 Tx1 能够被处理,而 Tx2 仍然固定在内存池中。这会锁定 BRC20 流动性并扰乱用户的正常转账。我们将这种 BRC20 固定攻击称为“固定攻击”。我们的攻击暴露了一个固有的设计缺陷,该缺陷可应用于比特币生态系统中 90% 以上的基于铭文的代币。我们还对币安的 ORDI 热钱包(最流行的 BRC20 代币和最活跃的钱包)进行了攻击,导致币安 ORDI 提币暂停 3.5 小时,在我们沟通后不久就恢复了。

使用流程挖掘进行技能学习以生成大型语言模型计划

分类: 计算和语言, 人工智能, 数据库, 新兴技术, 机器学习

作者: Andrei Cosmin Redis, Mohammadreza Fani Sani, Bahram Zarrin, Andrea Burattin

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.12870v1

摘要: 大型语言模型 (LLM) 有望为复杂任务生成计划,但其有效性受到顺序执行、缺乏控制流模型以及技能检索困难的限制。随着大语言模型在自动化和决策中变得越来越重要,解决这些问题对于提高计划生成的效率和可解释性至关重要。我们通过集成流程挖掘技术、利用技能获取的流程发现、技能存储的流程模型以及技能检索的一致性检查,引入了一种新的大语言模型技能学习方法。我们的方法通过实现灵活的技能发现、并行执行和改进的可解释性来增强基于文本的计划生成。实验结果表明我们的方法是有效的,我们的技能检索方法在特定条件下超越了最先进的准确性基线。

使用铁电 SQUID 的节能低温三元内容可寻址存储器

分类: 新兴技术, 应用物理

作者: Shamiul Alam, Simon Thomann, Shivendra Singh Parihar, Yogesh Singh Chauhan, Kai Ni, Hussam Amrouch, Ahmedullah Aziz

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.11091v1

摘要: 三态内容可寻址存储器(TCAM)对于某些计算任务非常有用,因为它们允许我们将搜索查询与存储在存储器阵列中的整个数据集进行比较。它们还可以通过并行搜索提高速度和能源效率,为量子计算、高性能计算和太空探索等低温应用发挥独特的优势。本文探讨了基于铁电超导量子干涉器件(FeSQUID)的低温三态内容寻址存储器的设计和实现。使用 FeSQUID 设计 TCAM 具有多种独特的优势。首先,我们可以在不使用任何外围电路的情况下获得匹配和不匹配条件的二元决策(零或非零电压)。此外,由于使用了节能的 SQUID,所提出的 TCAM 需要超低能耗(1 位二进制和三元搜索的平均能耗分别为 1.36 aJ 和 26.5 aJ)。最后,我们通过超维计算(HDC)的类脑应用展示了 FeSQUID 的效率。在这里,基于 FeSQUID 的 TCAM 实现了关联存储器,以支持推理步骤中所需的高度并行搜索。我们使用 10,000 位向量大小估计每个向量比较的能耗为 89.4 fJ。我们还将基于 FeSQUID 的 TCAM 阵列与基于 5nm FinFET 的低温 SRAM 的 TCAM 阵列进行比较,并观察到所提出的基于 FeSQUID 的 TCAM 阵列在执行相同任务时消耗的能量降低了一个数量级以上。

探索基于智能手机的分光光度法进行营养物质识别和定量

分类: 医学物理, 新兴技术, I.4.9; J.3

作者: Andrew Balch, Maria A. Cardei, Afsaneh Doryab

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.11027v1

摘要: 营养不均衡是一个全球健康问题,具有显着的下游影响。目前评估营养水平的方法面临一些局限性,其中可及性是一个主要问题。在本文中,我们朝着易于测量体内营养状况迈出了一步。我们通过构建和测试两个原型设备,探索基于智能手机的分光光度法在识别和量化解决方案中营养物质的潜力。我们比较了原型,发现最初的、更简单的原型所带来的局限性在更便携和可靠的设备中得到了很好的解决。第二代设备。通过第二代原型,我们创建并实现了用于分析吸收光谱的半自动信号处理和分析管道。我们通过分析四种不同光源和三种参考光谱策略的效果,彻底评估了原型。结果表明,LED 灯泡光源表现最佳,并且所有参考光谱策略的表现相似。然后,我们将第二代原型与台式实验室分光光度计进行比较,以进一步验证该设备。我们应用比尔-朗伯定律来证明我们的原型能够量化溶液中维生素 B12 的含量,准确度高达 91.3%。我们的深入分析、讨论和结果证明了基于智能手机的分光光度法作为一种识别和量化营养物质的简便方法的潜在用途,并为未来将该方法应用于人体的发展铺平了道路。

通过中间矩阵乘积算子进行量子电路的等价检查

分类: 量子物理学, 新兴技术

作者: Aaron Sander, Lukas Burgholzer, Robert Wille

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10946v1

摘要: 随着量子计算的进步,量子电路的复杂性正在迅速增加,因此需要强大的方法来辅助其设计。等效性检查在识别这些电路的编译和优化过程中可能出现的错误方面起着至关重要的作用,是量子电路验证的关键步骤。在这项工作中,我们介绍了一种基于矩阵乘积算子(MPO)的新颖方法来确定量子电路的等价性。我们的方法将来自两个电路的张量量子门收缩到一个中间 MPO,利用它们的可逆性来确定它们的等价或不等价。我们的结果表明,该方法比现有方法提供了显着的可扩展性改进,针对我们探索的实际用例,在电路宽度和深度上进行了多项式缩放。我们期望这项工作为量子电路的可扩展等效性检查设定新标准,并将成为验证日益复杂的量子系统的重要工具。

焦平面划分的完全可编程空间光子发射机

分类: 光学, 无序系统和神经网络, 新兴技术, 应用物理

作者: Daniele Veraldi, Davide Pierangeli, Silvia Gentilini, Marcello Calvanese Strinati, Jason Sakellariou, James S. Cummins, Airat Kamaletdinov, Marvin Syed, Richard Zhipeng Wang, Natalia G. Berloff, Dimitrios Karanikolopoulos, Pavlos G. Savvidis, Claudio Conti

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10689v1

摘要: Ising 机是一类新兴硬件,有望为 NP 难组合优化问题提供超快且节能的解决方案。空间光子伊辛机(SPIM)利用自由空间中的光学计算来加速计算,展示了并行性、可扩展性和低功耗。然而,当前的 SPIM 只能解决有限类别的问题。这种部分可编程性是阻碍其基准测试的一个关键限制。在保持设备可扩展性的同时实现设备的完全可编程性是一项公开的挑战。在这里,我们报告了通过基于焦平面划分的新颖操作方法实现的完全可编程 SPIM。在我们的方案中,一般的伊辛问题被分解为一组马蒂斯哈密顿量,通过测量相机传感器不同区域的强度来同时光学计算其能量。利用这个概念,我们通过实验证明了在有和没有铁磁偏置的未加权最大割图上最多 32 个自旋 Ising 模型的基态解的高成功概率计算。硬件模拟证明了精度随旋转次数的良好缩放。我们完全可编程的 SPIM 能够实现许多二次无约束二元优化问题,进一步将 SPIM 确立为非冯诺依曼硬件的领先范例。

自反性输入输出因果机制

分类: 机器人技术, 新兴技术, 系统与控制, 系统与控制

作者: Ryotaro Kayawake, Haruto Miida, Shunsuke Sano, Issei Onda, Kazuki Abe, Masahiro Watanabe, Josephine Galipon, Riichiro Tadakuma, Kenjiro Tadakuma

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10568v1

摘要: 本文探讨了反射驱动的概念,研究机器人如何利用内部和外部刺激来触发机器人的运动、性能或物理特征(例如其尺寸、形状或配置等)的变化。这些变化本身可以依次重新用作输入以驱动进一步的适应。从生物系统中汲取灵感,反射是响应环境变化的重要组成部分,反射驱动对于使机器人适应不同的情况和执行复杂的任务至关重要。分析了反射驱动的基本原理,并提供了现有实现的示例,例如接触敏感反射臂、物理计数器及其应用。该论文还概述了推进该研究领域的未来方向和挑战,强调了其在开发自适应、响应式机器人系统中的重要性。

ZONIA:用于区块链物联网应用的零信任预言机系统

分类: 新兴技术

作者: Lorenzo Gigli, Ivan Zyrianoff, Federico Montori, Luca Sciullo, Carlos Kamienski, Marco Di Felice

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10532v1

摘要: 物联网 (IoT) 的快速扩张带来了巨大的数据可靠性和系统透明度挑战,而现有物联网架构的集中化性质加剧了这一挑战。这种集中化通常会导致孤立的数据生态系统,其中互操作性问题和不透明的数据处理实践会损害物联网应用程序的实用性和可信度。为了解决这些问题,我们引入了 ZONIA(物联网应用零信任预言机网络),这是一种新颖的区块链预言机系统,旨在增强物联网环境中的数据完整性和去中心化性。与依赖可信执行环境和集中式数据源的传统方法不同,ZONIA 采用去中心化的零信任模型,允许匿名参与并集成多个数据源以确保公平性和可靠性。本文概述了 ZONIA 的架构,该架构支持语义和地理空间查询,详细介绍了其数据可靠性机制,并提出了综合评估,证明其可扩展性以及针对数据伪造和共谋攻击的弹性。分析和实验结果都证明了 ZONIA 的可扩展性,展示了其在不同系统条件和工作负载下处理系统中越来越多的节点的可行性。此外,所实施的信誉机制显着提高了数据准确性,即使在 40% 的节点表现出恶意行为时也能保持高可靠性。

关于车对万物通信标准的性能、当前和未来使用情况的调查

分类: 新兴技术, 网络和互联网架构, 信号处理

作者: Falk Dettinger, Matthias Weiß, Daniel Dittler, Johannes Stümpfle, Maurice Artelt, Michael Weyrich

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10264v1

摘要: 道路使用者之间的无线通信对于环境感知、推理和任务规划至关重要,以实现全自动车辆,从而提高道路安全和运输效率。为了实现协同驾驶,车联网(V2X)的概念早已被业界引入。在过去的二十年里,基于 IEEE 802.11p 和蜂窝标准开发了多种通信标准,即专用短程通信 (DSRC)、智能交通系统 G5 (ITS-G5) 以及蜂窝和新型无线电车辆 -万物互联(C-V2X 和 NR-V2X)。然而,虽然有大量关于 V2X 和不同标准分析的出版物,但总结这些结果的调查却很少。此外,据我们所知,目前还没有任何调查能够分析全球 V2X 实施的未来可能趋势和挑战。因此,本文对车联网通信标准、其性能、当前和未来的应用以及相关挑战进行了详细调查。根据我们的研究,我们发现了一些研究空白,并提供了车对万物通信领域可能的未来图景。

从 x*y=k 到 Uniswap Hooks;去中心化交易所(DEX)的比较回顾

分类: 计算工程、金融和科学, 密码学和安全, 新兴技术

作者: Mohammad Ali Asef, Seyed Mojtaba Hosseini Bamakan

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10162v1

摘要: 去中心化交易所(DEX)是去中心化金融(DeFi)领域的关键应用,旨在通过智能合约和区块链网络促进无需信任的加密货币交易。 DEX 领域的发展始于 2018 年 Uniswap V1 使用简单数学公式实施自动做市商 (AMM) 系统。DEX 吸收了大量资金和 web3 爱好者的注意力,在其发展过程中取得了许多进步。最近一个值得注意的进步是 Uniswap v4 中引入了 hooks,它允许用户通过流动性池利用各种类似插件的功能。本文对 Uniswap、Curve 和 Balancer 等著名 DEX 协议进行了全面的分类和比较分析,并探讨了其他协议值得注意的方面。评估框架包括机制、组成部分、数学公式和流动性池的绩效。目标是阐明不同 AMM 模型的优点和局限性,突出 DEX 开发中的新兴概念,概述当前的挑战,并区分特定应用的最佳模型。结果和比较见解可以为 web3 开发者、区块链研究人员、交易者和监管方提供参考。

使用多代理图注意力强化学习的内容缓存辅助车辆边缘计算

分类: 多代理系统, 新兴技术

作者: Jinjin Shen, Yan Lin, Yijin Zhang, Weibin Zhang, Feng Shu, Jun Li

发布时间: 2024-10-14

链接: http://arxiv.org/abs/2410.10071v1

摘要: 为了避免重复的任务卸载并实现流行任务计算结果的重用,我们构建了一种新颖的内容缓存辅助车辆边缘计算(VEC)框架。面对不规则的网络拓扑和未知的环境动态,我们进一步提出了一种基于多智能体图注意强化学习(MGARL)的边缘缓存方案,该方案利用图注意卷积核来整合每个智能体的相邻节点的特征,并进一步加强代理商之间的合作。我们的模拟结果表明,与基线相比,我们提出的方案能够提高缓存资源的利用率,同时减少长期任务计算延迟。

适用于图像处理的节能且快速的基于忆阻器的串行乘法器

分类: 新兴技术, 硬件架构, 图像和视频处理

作者: Seyed Erfan Fatemieh, Bahareh Bagheralmoosavi, Mohammad Reza Reshadinezhad

发布时间: 2024-10-13

链接: http://arxiv.org/abs/2410.09953v1

摘要: 内存中忆阻处理(PIM)是克服冯诺依曼瓶颈的有前途的技术之一。减少处理器和存储器之间的数据传输以及数据密集型应用中忆阻器的数据处理可以减少能耗和处理时间。乘法器是基本算术电路之一,在数据密集型处理应用中发挥着重要作用。乘法器的计算复杂性使其成为影响PIM效率和能耗的算术电路之一,例如在卷积运算中。串行材料蕴含(IMPLY)逻辑设计是应用新兴忆阻技术实现算术电路的方法之一,该技术在交叉阵列结构中实现PIM。作者在本文中提出了使用串行 IMPLY 逻辑的无符号和有符号数组乘法器。通过应用所提出的部分乘积单元(PPU)和重叠计算步骤,所提出的乘法器与最先进的(SOA)相比有了显着改进。与经典设计相比,所提出的 8 位无符号阵列乘法器的计算步骤数、能耗和所需忆阻器分别提高了 36%、31% 和 47%。所提出的 8 位有符号乘法器还将计算步骤、能耗和所需忆阻器分别改进了高达 59%、54% 和 45%。还研究了所提出的乘法器在高斯模糊和边缘检测应用中的性能,仿真结果表明这些应用中的能耗提高了 31%,计算步骤数提高了 33%。

获得基于单元的模拟内容可寻址存储器,用于人工智能中的动态关联任务

分类: 新兴技术

作者: Paul-Philipp Manea, Nathan Leroux, Emre Neftci, John Paul Strachan

发布时间: 2024-10-13

链接: http://arxiv.org/abs/2410.09755v1

摘要: 模拟内容可寻址存储器 (aCAM) 已被证明对于关联内存计算应用(如决策树、有限状态机和超维计算)非常有用。虽然使用 FeFET 和 ReRAM 器件的非易失性实现具有速度、功耗和面积优势,但它们的写入速度慢且写入周期有限,这使得它们不太适合涉及完全动态数据模式的计算。为了解决这些限制,在这项工作中,我们提出了一种基于电容器增益单元的 aCAM,设计用于需要频繁内存更新的动态处理。我们的系统将模拟输入电压与电容器中存储的边界进行比较,从而实现高效的动态任务。我们通过用 aCAM 相似性替换 softmax 尺度的点积相似性,展示了 aCAM 在变压器注意力机制中的应用,取得了有竞争力的结果。 TSMC 28 nm 节点上的电路仿真显示在能源效率、精度和延迟方面具有良好的性能,使其非常适合快速、动态的 AI 应用。

用于加速磁共振成像的量子神经网络

分类: 图像和视频处理, 新兴技术, 量子物理学

作者: Shuo Zhou, Yihang Zhou, Congcong Liu, Yanjie Zhu, Hairong Zheng, Dong Liang, Haifeng Wang

发布时间: 2024-10-12

链接: http://arxiv.org/abs/2410.09406v1

摘要: 从欠采样k空间数据开始的磁共振图像重建需要恢复许多潜在的非线性特征,这对于算法来说很难恢复这些特征。近年来,量子计算的发展发现量子卷积可以提高网络精度,这可能是由于潜在的量子优势。本文提出了一种用于快速磁共振成像的包含量子和经典网络的混合神经网络,并在量子计算机模拟系统上进行了实验。实验结果表明混合网络取得了优异的重建效果,也证实了混合量子经典神经网络应用于快速磁共振成像图像重建的可行性。

比较量子编码技术

分类: 量子物理学, 新兴技术, 机器学习

作者: Nidhi Munikote, Ang Li, Chenxu Liu, Samuel Stein

发布时间: 2024-10-11

链接: http://arxiv.org/abs/2410.09121v1

摘要: 随着量子计算机的能力不断增强,其应用的可能性也随之增加。例如,量子技术正在与经典神经网络集成以执行机器学习。为了以这种方式使用,或者用于量子化学模拟或密码应用等任何其他广泛用途,经典数据必须通过量子编码转换为量子态。存在三种基本编码方法:基础、幅度和旋转,以及几种建议的组合。这项研究探索了编码方法,特别是在混合量子经典机器学习的背景下。本研究使用 QuClassi 量子神经网络架构对 MNIST 数据集中的“3”和“6”数字进行二元分类,在考虑资源使用和计算的同时,获得了准确性、熵、损失和抗噪声性等多个指标比较三种主要编码方法的复杂度。

基于预测树的虚拟键盘可改进注视打字

分类: 人机交互, 新兴技术

作者: Hrushikesh Etikikota, Yogesh Kumar Meena

发布时间: 2024-10-11

链接: http://arxiv.org/abs/2410.08570v1

摘要: 由于缺乏预测文本和以用户为中心的方法,屏幕键盘眼睛打字系统受到限制,导致文本输入率低和频繁的重新校准。这项工作建议将部分匹配(PPM)技术的预测集成到基于树的虚拟键盘中。我们使用具有十个命令的两级基于树的字符选择系统开发了 Flex-Tree 屏幕键盘,并使用三个级别的 PPM(PPM1、PPM2、PPM3)对其进行了测试。 Flex-Tree 提供对 72 个英文字符的访问,包括大小写字母、数字和特殊字符,并提供删除命令等更正功能。该系统由 16 名健康志愿者使用两项专门设计的打字任务(包括手工挑选和随机挑选的句子)进行了评估。拼写任务是使用两种输入方式执行的:(i)鼠标和(ii)便携式眼动仪。进行了两项实验,涵盖 24 种不同的条件。 Flex-Tree 的打字性能与基于树的字母排列虚拟键盘 (NoPPM) 和面向新用户的 Dasher 屏幕键盘进行了比较。配备 PPM3 的 Flex-Tree 优于其他键盘,使用鼠标的平均文本输入速度为 27.7 个字母/分钟,使用眼动仪的平均文本输入速度为 16.3 个字母/分钟。使用眼动仪,命令和字母级别的信息传输速率分别为 108.4 位/分钟和 100.7 位/分钟。 Flex-Tree 在所有三个级别的 PPM 中,在两种输入模式的系统可用性量表上获得了高评级,在 NASA 任务负载指数上获得了低权重评级,凸显了其以用户为中心的设计。

单服务器马尔可夫队列的量子模拟:动态放大方法

分类: 量子物理学, 新兴技术

作者: Michal Koren, Or Peretz

发布时间: 2024-10-10

链接: http://arxiv.org/abs/2410.08252v1

摘要: 量子计算正在彻底改变各个领域,包括运筹学和排队论。这项研究提出了一种模拟单服务器马尔可夫 (M/M/1) 队列的量子方法,使运筹学研究人员更容易使用量子计算。我们引入了一种适应队列流量的动态放大方法,有可能提高模拟效率,并为到达和服务流程设计定制参数化量子门。这种灵活的框架可以对各种排队场景进行建模,同时连接量子计算和经典排队理论。值得注意的是,我们的量子方法显示出优于经典模拟的潜在优势,特别是在高流量场景中。这种量子模拟方法为分析复杂排队系统开辟了新的可能性,在具有挑战性的场景中可能超越经典方法,并为量子增强运筹研究铺平道路。该方法在低、中和高流量场景下实施和测试,将量子模拟与理论公式和经典模拟进行比较。结果表明,量子计算与理论预测高度一致,高流量场景下有效到达率的相对误差低于 0.002。随着量子位数量的增加,我们观察到快速收敛到理论值,在某些情况下相对误差最多减少两个数量级。灵敏度分析揭示了最佳参数区域产生的误差低于 0.001。

D-Wave 的非线性程序混合求解器:描述和性能分析

分类: 新兴技术, 人工智能, 量子物理学

作者: Eneko Osaba, Pablo Miranda-Rodriguez

发布时间: 2024-10-10

链接: http://arxiv.org/abs/2410.07980v1

摘要: 先进量子经典算法的发展是量子计算中最突出的策略之一。最近引入了许多混合求解器。其中许多方法是专门为解决特定用例而创建的。然而,一些成熟的方案经常被用来解决优化问题。在此背景下,D-Wave 于 2020 年推出了混合求解器服务,提供了一系列方法,旨在为旨在优化性能和操作流程的用户加快解决方案时间。最近,该产品组合中添加了一项新技术:非线性程序混合求解器。本文描述了该求解器,并通过针对三个组合优化问题(旅行商问题、背包问题和最大割问题)的 45 个实例的基准测试来评估其性能。为了方便使用这个相对未经探索的求解器,我们提供了用于解决这三个优化问题的实现细节。

基于事件相关电位检测的脑机接口训练后量化

分类: 人机交互, 新兴技术

作者: Hubert Cecotti, Dalvir Dhaliwal, Hardip Singh, Yogesh Kumar Meena

发布时间: 2024-10-10

链接: http://arxiv.org/abs/2410.07920v1

摘要: 训练后量化 (PTQ) 是一种用于优化和减少机器学习模型的内存占用和计算要求的技术。它主要用于神经网络。对于完全便携且可在各种情况下使用的脑机接口(BCI),有必要提供轻量级的存储和计算方法。在本文中,我们提出对脑机接口最先进方法的训练后量化进行评估,并评估其对准确性的影响。我们评估了代表一种主要 BCI 范式的事件相关电位的单次试验检测的性能。当应用于空间滤波器和分类器时,接受者操作特征曲线下的面积从 0.861 下降到 0.825,同时将模型的大小减小约 $\times$ 15。结果支持以下结论:PTQ 可以大幅减小模型的内存占用,同时保持大致相同的精度水平。

Heracles:用于高效电路仿真的 HfO$\mathrm{_2}$ 铁电电容器紧凑模型

分类: 新兴技术

作者: Luca Fehlings, Md Hanif Ali, Paolo Gibertini, Egidio A. Gallicchio, Udayan Ganguly, Veeresh Deshpande, Erika Covi

发布时间: 2024-10-10

链接: http://arxiv.org/abs/2410.07791v1

摘要: 本文提出了一种基于物理的紧凑模型,用于在 SPICE 环境中对基于 HfO2 的铁电电容器 (FeCap) 进行电路仿真。该模型已根据从 HfO2 基 FeCap 获得的实验数据进行了校准。包含准确描述器件寄生效应的热模型,以根据第一原理推导出精确的器件特性。该模型结合了统计数据,可基于实际分布进行蒙特卡洛分析,从而使其特别适合设计技术协同优化 (DTCO)。此外,使用具有电流编程的集成电路在电路模拟中演示了该模型,其中观察到铁电极化的部分切换。最后,该模型在阵列仿真中进行了基准测试,在阵列大小为 100 kb 的情况下,在 1.8 秒内达到收敛。

可重构智能表面支持的 MIMO MAC:容量区域和大型系统分析

分类: 信息论, 新兴技术, 信息论

作者: Aris L. Moustakas, George C. Alexandropoulos

发布时间: 2024-10-09

链接: http://arxiv.org/abs/2410.07389v1

摘要: 由多个分布式可重构智能表面 (RIS) 支持的智能无线环境作为第六代 (6G) 网络的无线连接范例最近引起了广泛的研究兴趣。在本文中,使用随机矩阵理论方法,我们计算存在多个 RIS 的情况下相关多输入多输出 (MIMO) 多址接入信道 (MAC) 的互信息 (MI) 总和的平均值,在大范围内- 天线数量限制。因此,在对可调 RIS 的相位配置进行优化后,我们获得了容量区域边界。此外,我们获得了 MI 总和度量方差的封闭式表达式,它与均值一起为中断概率提供了严格的高斯近似。当信道估计极具挑战性时,在存在快衰落的情况下,得出的结果变得相关。我们的数值研究表明,当每个 RIS 邻域的角度扩展较小时(这对于较高的载波频率而言是预期的),通过优化多个 RIS 的遍历 MI,通信链路会得到显着改善。我们还发现,增加此类 MIMO-MAC-RIS 系统中的传输用户数量导致 MI 增益之和迅速减小,因此限制了给定 RIS 可以有效服务的用户数量。

生存还是毁灭(在欧盟):衡量 Cookie 付费专区中存在的差异

分类: 计算机与社会, 新兴技术

作者: Andreas Stenwreth, Simon Täng, Victor Morel

发布时间: 2024-10-09

链接: http://arxiv.org/abs/2410.06920v2

摘要: Cookie 付费墙允许访问者仅在支付费用(支付选项)或接受跟踪(Cookie 选项)之间做出选择后才能访问网站内容。之前的研究已经对这种做法的普遍性和法律地位进行了研究,但客户设备和地理位置的影响仍未得到探索。为了解决这些问题,本研究探讨了三个因素的影响:1) 客户端浏览器,2) 设备类型(台式机或移动设备),3) 地理位置对 cookie 付费墙的存在和行为以及处理用户的数据。在由 804 个提供 Cookie 付费专区的网站组成的数据集上使用自动爬虫,我们发现 Cookie 付费专区的存在受用户地理位置的影响最大。我们进一步表明,cookie 付费墙的行为和用户数据的处理都受到所有三个因素的影响,但没有发现重要的模式。最后,我们发现大约 11% 的研究网站使用了另一种类型的付费墙,即“双重付费墙”,其中包含一个 cookie 付费墙,一旦接受跟踪,就会辅以另一个付费墙。

RIS 辅助 ISAC:单静态目标检测的预编码和相移优化

分类: 信号处理, 新兴技术

作者: Özlem Tuğfe Demir, Emil Björnson

发布时间: 2024-10-09

链接: http://arxiv.org/abs/2410.06855v1

摘要: 可重构智能表面(RIS)技术成为快速发展的集成传感和通信范例中非常有用的组成部分,这主要是由于其卓越的信噪比增强能力。在本文中,我们的重点是单静态目标检测,同时考虑用户设备的通信要求。传感和通信都受益于 RIS 的存在,这使得通道更加丰富和强大。与之前的研究不同,我们全面检查了三个目标回波路径:直接(静态)通道路径、通过 RIS 的路径以及这些路径的组合,每个路径都具有不同的雷达横截面 (RCS)。我们在分布未知但其所在的低秩子空间的杂波下同时考虑视线(LOS)和非视线(NLOS)路径。我们推导了广义似然比测试 (GLRT) 检测器,并引入了一种联合优化 RIS 相移和预编码配置的新方法。我们的模拟结果强调了这种组合设计在提高检测概率方面的重要性。此外,很明显,衍生的杂波感知目标检测显着增强了检测性能,特别是当杂波很强时。

使用事件相机进行基于傅里叶的野生动物行为量化动作识别

分类: 计算机视觉和模式识别, 新兴技术

作者: Friedhelm Hamann, Suman Ghosh, Ignacio Juarez Martinez, Tom Hart, Alex Kacelnik, Guillermo Gallego

发布时间: 2024-10-09

链接: http://arxiv.org/abs/2410.06698v1

摘要: 事件相机是新型仿生视觉传感器,可以异步测量像素级亮度变化,而不是在给定帧速率下测量图像。它们具有良好的优势,即高动态范围、低延迟和最小的运动模糊。现代计算机视觉算法通常依赖于人工神经网络方法,该方法需要类似图像的数据表示,并且不能充分利用事件数据的特征。我们提出了基于傅里叶变换的动作识别方法。这些方法旨在识别自然界中常见的振荡运动模式。特别是,我们将我们的方法应用于最近的繁殖企鹅数据集,这些数据集被注释为“狂喜展示”,即观察到的企鹅以一定频率拍打翅膀的行为。我们发现我们的方法既简单又有效,产生的结果略低于深度神经网络 (DNN),同时仅依赖于与 DNN 相比的一小部分参数(参数少了五个数量级)。尽管数据集中存在不受控制的多样化数据,但它们仍能正常工作。我们希望这项工作为基于事件的处理和动作识别开辟新的视角。

用于同步通信和传感的带内全双工 MIMO 系统:挑战、方法和未来前景

分类: 信息论, 新兴技术, 信号处理, 信息论

作者: Besma Smida, George C. Alexandropoulos, Taneli Riihonen, Md Atiqul Islam

发布时间: 2024-10-09

链接: http://arxiv.org/abs/2410.06512v1

摘要: 带内全双工 (FD) 多输入多输出 (MIMO) 系统由于能够实现同步信号传输和接收,因此为集成传感和通信 (ISAC) 提供了重要机会。最近,该功能已被用来设计频谱高效的同步信息传输和单基地感测操作,这一研究领域通常称为 MIMO FD-ISAC。在本文中,我们利用最新的 FD MIMO 架构并降低了模拟消除的复杂性,提出了一种支持 FD 的框架,用于使用数据信号进行同步通信和传感。与通信应用相比,该框架的目标不是减轻自干扰,因为它包括来自 FD 节点附近目标的下行链路数据传输的反射,而是优化系统参数以实现预期的双重功能。讨论了通用 MIMO FD-ISAC 系统的独特特征和挑战,并广泛概述了最先进的特殊情况,包括数值研究。还提供了与信号处理社区相关的支持 FD 的 ISAC 未来工作的几个方向。

广义 LinkedIn 皇后游戏的 QUBO 公式

分类: 量子物理学, 新兴技术, 大众物理, 90C27, 90C20, 81Q99, G.1.6; G.2.1

作者: Alejandro Mata Ali, Edgar Mencia

发布时间: 2024-10-08

链接: http://arxiv.org/abs/2410.06429v1

摘要: 在本文中,我们提出了一种 QUBO 公式,旨在解决 LinkedIn 皇后游戏(N 皇后问题的一个版本)的一系列概括。我们通过尝试优化变量和交互的数量,针对问题的几个特定情况调整该公式,通过量子退火或量子近似优化算法(QAOA)提高将其应用于量子硬件的可能性。我们还提出了两种新类型的问题,即彩色棋子问题和最大棋子问题及其相应的 QUBO 公式。

RealityCraft:通过场景感知增强现实为新手提供现场 CAD+CAM 界面

分类: 人机交互, 新兴技术, 图形, H.5.0; H.5.1; H.5.2

作者: Oğuz Arslan, Artun Akdoğan, Mustafa Doga Dogan

发布时间: 2024-10-08

链接: http://arxiv.org/abs/2410.06113v1

摘要: 尽管用于可视化的增强现实(AR)越来越容易使用,但现有的计算机辅助设计系统仍然主要局限于传统屏幕,并且由于其复杂性,新手用户通常无法使用。我们推出了 RealityCraft,这是一个开源 AR 界面,可为新手提供现场计算机辅助设计和制造 (CAD+CAM)。与局限于计算机屏幕的传统 CAD 系统不同,RealityCraft 允许用户直接在物理环境中使用原始几何形状进行设计。 RealityCraft 识别并利用家具和墙壁等物理约束,通过空间意识和深度遮挡增强用户交互。此外,RealityCraft 还具有基于 AR 的集成 3D 打印工作流程,用户可以将设计拖放到其直接空间中的 3D 打印机虚拟双胞胎上。通过用户研究,我们证明 RealityCraft 增强了新手的参与度和易用性。通过弥合数字创作和物理输出之间的差距,RealityCraft 旨在将日常空间转变为创意工作室。

SpecTrack:通过散斑成像学习多旋转跟踪

分类: 新兴技术, 计算机视觉和模式识别

作者: Ziyang Chen, Mustafa Doğa Doğan, Josef Spjut, Kaan Akşit

发布时间: 2024-10-08

链接: http://arxiv.org/abs/2410.06028v1

摘要: 由于精确姿态检测在确保准确定位信息方面发挥着关键作用,因此在个人制造、虚拟现实 (VR) 和机器人技术等领域对精确姿态检测的需求日益增长。然而,这些系统中使用的传统基于视觉的系统通常难以实现高精度和准确度,特别是在处理复杂环境或快速移动物体时。为了解决这些限制,我们研究了激光散斑成像(LSI),这是一种新兴的光学跟踪方法,为提高姿态估计精度提供了广阔的前景。具体来说,我们提出的基于 LSI 的跟踪 (SpecTrack) 利用无镜头相机和具有编码孔径的后向反射器标记的捕获来实现高精度的多轴旋转姿态估计。我们使用内部构建的测试台进行的广泛试验表明,SpecTrack 的准确度达到 0.31{\deg} (std=0.43{\deg}),显着优于最先进的方法,并将准确度提高高达 200% 。

使用多端口光电探测器的波导复用光子矩阵矢量乘法处理器

分类: 光学, 新兴技术

作者: Rui Tang, Makoto Okano, Chao Zhang, Kasidit Toprasertpong, Shinichi Takagi, Mitsuru Takenaka

发布时间: 2024-10-08

链接: http://arxiv.org/abs/2410.05956v1

摘要: 摩尔定律的放缓推动了深度学习专用处理器的发展。模拟光子处理器通过利用光域中的并行计算,为加速深度学习中的矩阵向​​量乘法 (MVM) 提供了一种有前途的解决方案。基于强度的光子 MVM 处理器不利用光的相位信息,由于其简化的操作而很有吸引力。然而,此类处理器现有的基于强度的方案通常采用波长复用或模式复用,这两种技术由于高插入损耗或波长串扰而具有有限的可扩展性。在这项工作中,我们提出了一种基于波导复用概念的可扩展的基于强度的光子 MVM 处理器。该方案采用多端口光电探测器 (PD) 对多个光信号的强度进行求和,从而无需使用多个波长或模式。演示了在 -3 V 偏置电压下具有 11.8 GHz 3 dB 带宽的 16 端口 Ge PD,并且可以进一步扩展以处理 250 个端口,同时保持 6.1 GHz 工作带宽。在绝缘体上硅 (SOI) 平台上制造的 4 × 4 电路用于在专为鸢尾花分类而设计的 3 层神经网络中执行 MVM,实现了 93.3% 的分类精度。此外,还模拟了 Fashion-MNIST 的卷积神经网络 (CNN) 中的大规模电路的性能,分类准确率达到 90.53%。这项工作为光子 MVM 提供了一种简化且可扩展的方法,为光神经网络中大规模、多维光子矩阵-矩阵乘法奠定了基础。

由投射光驱动的触觉显示器

分类: 新兴技术

作者: Max Linannder, Dustin Goetz, Gregory Reardon, Elliot Hawkes, Yon Visell

发布时间: 2024-10-07

链接: http://arxiv.org/abs/2410.05494v1

摘要: 为数字内容提供有形形式的触觉显示器可以深刻地改变我们与计算机交互的方式,就像视觉显示器在过去 60 年里推动了计算领域的连续革命一样。然而,事实证明,创建具有感知保真度所需的驱动速度、动态范围和分辨率的触觉显示器具有挑战性。在这里,我们展示了一种触觉显示器,它使用填充有毫米级光触觉像素阵列的能量被动光机械表面,直接将投射光转换为可见的触觉图案。像素通过光刺激的快速热气体膨胀将入射光转换为机械位移,产生高达 1 毫米的位移和 2 至 100 毫秒的响应时间。我们使用投射光进行电力传输和寻址,使这些显示器能够以可持续的成本和复杂性扩展尺寸和分辨率。我们演示了具有多达 1,511 个独立可寻址像素的设备。感知研究证实了显示器准确再现位置、时间、频率和结构方面的触觉模式的能力。这项研究为光驱动的实用、多功能高分辨率触觉显示器奠定了基础。

OmniBuds:用于高级生物传感和设备上机器学习的传感耳戴式平台

分类: 新兴技术, 机器学习

作者: Alessandro Montanari, Ashok Thangarajan, Khaldoon Al-Naimi, Andrea Ferlini, Yang Liu, Ananta Narayanan Balaji, Fahim Kawsar

发布时间: 2024-10-07

链接: http://arxiv.org/abs/2410.04775v1

摘要: 感官耳戴式设备已从基本的音频增强设备发展成为用于临床级健康监测和健康管理的复杂平台。本文介绍了 OmniBuds,这是一种先进的感觉耳戴式平台,集成了多个生物传感器和由机器学习加速器提供支持的板载计算,所有这些都位于实时操作系统 (RTOS) 内。该平台的双耳对称设计,配备精确定位的动力学、声学、光学和热传感器,可实现高度准确和实时的生理评估。与依赖外部数据处理的传统耳机不同,OmniBuds 利用实时板载计算,通过本地处理数据来显着提高系统效率、减少延迟并保护隐私。此功能包括直接在设备上执行复杂的机器学习模型。我们对 OmniBuds 的设计、硬件和软件架构进行了全面分析,展示了其多功能应用、准确稳健的生理参数跟踪以及先进的人机交互的能力。

应用量子自动编码器进行时间序列异常检测

分类: 机器学习, 人工智能, 新兴技术, 量子物理学

作者: Robin Frehner, Kurt Stockinger

发布时间: 2024-10-05

链接: http://arxiv.org/abs/2410.04154v2

摘要: 异常检测是欺诈检测、模式识别或医疗诊断等各个领域应用的一个重要问题。已经使用经典计算方法引入了几种算法。然而,使用量子计算解决时间序列数据中的异常检测问题是一个尚未广泛探索的研究领域。本文探讨了量子自动编码器在时间序列异常检测中的应用。我们研究了两种主要的异常分类技术:(1)分析量子自动编码器生成的重建误差;(2)潜在表示分析。我们在各种 ansaetze 上进行的模拟实验结果表明,量子自动编码器在多个数据集上始终优于基于经典深度学习的自动编码器。具体来说,量子自动编码器实现了卓越的异常检测性能,同时使用的参数减少了 60-230 倍,所需的训练迭代次数减少了五倍。此外,我们在真正的量子硬件上实现了我们的量子编码器。我们的实验结果表明,量子自动编码器实现了与模拟对应物相当的异常检测性能。

Malak:基于人工智能的多语言个人助理,可对抗错误信息和生成式人工智能安全问题

分类: 人机交互, 新兴技术

作者: Farnaz Farid, Farhad Ahamed

发布时间: 2024-10-04

链接: http://arxiv.org/abs/2410.11856v1

摘要: 人工智能技术生成数字内容的广泛使用导致了错误信息和网络伤害的增加。深度造假技术是人工智能的一种,可以更轻松地在社交媒体上创建令人信服的虚假内容,从而导致各种网络威胁。恶意行为者利用人工智能功能,对个人造成数字、身体和心理伤害。虽然社交媒体平台具有内容评级和反馈系统等安全措施,但这些平台通常由数字素养较高的人使用。缺乏预防措施,并且需要可供数字素养较低的人使用的用户友好工具。我们的目标是创建一个用户友好的基于人工智能的多语言个人助理 Malak,以减少在线伤害并促进安全的在线互动,使识字水平较低的用户受益。

联邦学习赋能的智能原生网络切片安全架构

分类: 密码学和安全, 人工智能, 新兴技术, 机器学习, 网络和互联网架构, I.2; I.6; F.2.2

作者: Rodrigo Moreira, Rodolfo S. Villaca, Moises R. N. Ribeiro, Joberto S. B. Martins, Joao Henrique Correa, Tereza C. Carvalho, Flavio de Oliveira Silva

发布时间: 2024-10-04

链接: http://arxiv.org/abs/2410.05312v1

摘要: 网络切片 (NS) 改变了网络资源共享的格局,提供灵活性来支持下一代 5G/6G 移动网络 (NGMN)、车载网络、工业物联网等领域具有高度可变需求的服务和应用(物联网)和垂直领域。尽管大量的研究和实验推动了网络切片的发展,但现有架构往往缺乏内在的架构智能安全能力。本文提出了一种架构智能安全机制来改进 NS 解决方案。我们理想化了一种安全原生架构,将智能微服务部署为基于机器学习的联合代理,为切片未来互联网基础设施 (SFI2) 参考架构提供切片内和架构操作安全性。值得注意的是,联邦学习方法与高度分布式的现代微服务架构相匹配,从而为解决服务和安全问题的 NS 平台提供了统一且可扩展​​的设计选择。使用 ML-Agent 和安全代理,我们的方法使用通用和非侵入式遥测记录识别切片内的分布式拒绝服务 (DDoS) 和入侵攻击,在网络切片架构中实现约 95.60%$ 的平均准确度$99.99%$ 用于部署的切片——切片内。这一结果展示了利用架构操作安全性的潜力,并为网络切片架构引入了一个有前景的新研究方向。

基于 9T4R RRAM 的 ACAM,用于边缘模拟模板匹配

分类: 系统与控制, 硬件架构, 新兴技术, 系统与控制

作者: Georgios Papandroulidakis, Shady Agwa, Ahmet Cirakoglu, Themis Prodromakis

发布时间: 2024-10-04

链接: http://arxiv.org/abs/2410.03414v1

摘要: 计算瓶颈不断转移到内存访问和数据传输,尤其是人工智能应用,迫切需要重新设计计算机架构基础。由于边缘对面积和功率的严格要求,许多边缘计算应用(例如可穿戴和植入式医疗设备)给传统计算系统带来了越来越多的挑战。电阻 RAM (RRAM) 等新兴技术在开发能够实现高分类能力和高能效的神经模拟计算范例方面表现出了良好的势头。在这项工作中,我们提出了一种新颖的基于 RRAM 的模拟内容可寻址存储器 (ACAM),用于在线模拟模板匹配应用。这种基于 ACAM 的模板匹配架构旨在实现节能分类,其中低能耗至关重要。我们展示了一种高度可调的新型基于 RRAM 的 ACAM 像素,该像素使用商用 180nm CMOS 技术和内部 RRAM 技术实现,并在 66MHz 和 3V 电源电压下,失配和匹配时分别表现出约 0.036pJ 和 0.16pJ 的低能量耗散。基于这种新颖像素设计的概念验证系统级实现也在 180nm 中实现。

可验证的加密物理安全 TEE 的研究方向

分类: 密码学和安全, 硬件架构, 新兴技术

作者: Sylvain Bellemare

发布时间: 2024-10-04

链接: http://arxiv.org/abs/2410.03183v2

摘要: Web3 世界的一个利基角落越来越多地利用基于硬件的可信执行环境 (TEE) 来构建去中心化基础设施。使用 TEE 的动机之一是超越基于密码学的替代方案(例如零知识证明 (ZKP)、完全同态加密 (FHE) 和多方计算 (MPC))当前的性能限制。尽管具有吸引人的优势,但当前的 TEE 仍受到严重限制,因为它们不能抵御物理攻击,而且其证明机制植根于芯片制造商的信任。因此,Web3应用程序必须依赖云基础设施来充当基于硬件的TEE的可信守护者,并且必须接受信任的芯片制造商。这项工作旨在探索我们如何设计和实现能够安全抵御物理攻击并且不需要信任芯片制造商的芯片。这项工作的目标之一是激励 Web3 运动承认并利用现有的大量相关硬件研究。简而言之,是以下各项的组合:(1) 物理不可克隆功能 (PUF),以确保信任根的安全; (2) 保护计算安全的掩码和冗余技术; (3) 开源硬件和成像技术,以验证芯片是否符合其预期设计;可以帮助证明给定的 TEE 是可信的,而无需信任云提供商和芯片制造商。

Q-SCALE:基于量子计算的传感器校准,可实现高级学习和效率

分类: 机器学习, 新兴技术

作者: Lorenzo Bergadano, Andrea Ceschini, Pietro Chiavassa, Edoardo Giusto, Bartolomeo Montrucchio, Massimo Panella, Antonello Rosato

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02998v1

摘要: 在空气污染严重的世界中,利用量子计算 (QC) 和机器学习 (ML) 集成最先进的传感器校准技术有望提高智慧城市空气质量监测系统的准确性和效率。本文研究了通过深度学习 (DL) 和量子机器学习 (QML) 等先进方法校准廉价光学细尘传感器的过程。该项目的目标是比较经典领域和量子领域的四种复杂算法,以辨别它们的差异,并探索可能的替代方法,以提高城市空气质量监测中颗粒物测量的精度和可靠性。经典前馈神经网络 (FFNN) 和长短期记忆 (LSTM) 模型根据其量子对应模型进行评估:变分量子回归器 (VQR) 和量子 LSTM (QLSTM) 电路。通过细致的测试,包括超参数优化和交叉验证,该研究评估了量子模型改善校准性能的潜力。我们的分析表明: 与 VQR 模型相比,FFNN 模型在测试集上实现了更高的校准精度,L1 损失函数更低(2.92 vs 4.81);尽管使用较少的可训练权重(66 vs 482),QLSTM 的性能仍略优于 LSTM 模型(测试集损失:2.70 vs 2.77)。

AiBAT:人工智能/构建、组装和测试说明

分类: 人工智能, 硬件架构, 新兴技术, 人机交互

作者: Benjamin Nuernberger, Anny Liu, Heather Stefanini, Richard Otis, Amanda Towler, R. Peter Dillon

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02955v1

摘要: 构建、组装和测试说明 (IBAT) 是指对硬件进行任何操作(包括测试、组装和维护)时使用的流程。目前,IBAT 文档的生成非常耗时,因为用户必须手动引用工程图和零件清单中的信息并将其传输到 IBAT 指令中。然而,随着机器学习和计算机视觉的进步,人工智能 (AI) 模型可以执行 IBAT 模板的部分填充,从而释放工程师时间来执行更高技能的任务。 AiBAT 是一个帮助用户编写IBAT 的新颖系统。它的工作原理是首先分析装配图文档,提取信息并解析它,然后用提取的信息填充 IBAT 模板。这种辅助创作有可能节省时间并降低成本。本文概述了 AiBAT 系统,包括有希望的初步结果和对未来工作的讨论。

O-RAN 迈向 6G 的数字孪生

分类: 网络和互联网架构, 新兴技术, 信号处理

作者: Huan X. Nguyen, Kexuan Sun, Duc To, Quoc-Tuan Vien, Tuan Anh Le

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02954v1

摘要: 在 5G 和 6G 以后的未来无线系统中,解决具有不同质量要求的各种应用至关重要。开放式无线接入网络 (O-RAN) 架构提供了根据流量需求进行动态资源调整的潜力。然而,实现实时资源编排仍然是一个挑战。同时,数字孪生 (DT) 技术有望测试和分析复杂系统,为解决 O-RAN 架构中的动态操作和自动化问题提供独特的平台。然而,为复杂的 5G/6G 网络开发 DT 带来了挑战,包括数据交换、ML 模型训练数据可用性、网络动态、处理能力限制、跨学科协作需求以及缺乏标准化方法。本文概述了 Open RAN 架构、趋势和挑战,提出了 O-RAN 的 DT 概念,并通过解决方案示例展示了其与框架的集成。

GTQCP:贪婪拓扑感知量子电路分区

分类: 量子物理学, 新兴技术

作者: Joseph Clark, Travis S. Humble, Himanshu Thapliyal

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02901v1

摘要: 我们提出了贪婪拓扑感知量子电路分区(GTQCP),这是一种新颖的量子门电路分区方法,该方法通过对电路的量子位依赖图应用贪婪启发式来分区电路。 GTQCP 与其他三种门分区方法进行了比较,其中两种(QuickPartitioner 和 ScanPartitioner)是 Berkley Quantum Synthesis Toolkit 的一部分。 GTQCP 与最快的方法 (QuickPartitioner) 相比,运行时间提高了 18%,与最高质量的方法 (ScanPartitioner) 相比,运行时间提高了 96%。该算法还表现出与 ScanPartitioner 几乎相同的结果质量(分区数量),并且比 QuickPartitioner 的质量提高了 38%。

MQT Qudits:混合维度量子计算的软件框架

分类: 量子物理学, 新兴技术, 高能物理 - 理论

作者: Kevin Mato, Martin Ringbauer, Lukas Burgholzer, Robert Wille

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02854v1

摘要: 量子计算在许多领域有望超越经典设备的限制。然而,尽管取得了令人印象深刻的进展,但当前的研究主要集中在量子位上。与此同时,基于多级qudit系统的量子硬件提供了一系列优势,包括扩展的门集、更高的信息密度和更高的计算效率,这可能在克服经典量子计算机的局限性方面发挥关键作用。机器,也包括当前基于量子位的量子设备。然而,使用量子不仅面临实验控制方面的挑战,而且特别是算法开发和量子软件方面的挑战。在这项工作中,我们介绍了 MQT Qudits,这是一种开源工具,作为慕尼黑量子工具包 (MQT) 的一部分,旨在帮助设计和实现混合维度 qdit 设备的应用程序。我们为混合维度系统指定了一种标准化语言,并讨论了电路规范、硬件门集编译、高效电路仿真和开放挑战。 MQT Qudits 可在 github.com/cda-tum/mqt-qudits 上获取,在 pypi 上可在 pypi.org/project/mqt.qudits 上获取。

使用 ARM TrustZone 技术的基于边缘计算的工业 4.0 工业网关

分类: 密码学和安全, 分布式、并行和集群计算, 新兴技术

作者: Sandeep Gupta

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02529v1

摘要: 在典型自动化金字塔的五个层次之间建立无缝联系的安全高效的通信对于工业 4.0 至关重要。具体来说,这些级别的纵向和横向整合是提高生产力和改善运营活动的首要要求。垂直集成可以通过连接系统和应用程序来提高可视性、灵活性和生产力。横向整合可以通过连接供应链中的内部生产设施、多站点运营和第三方合作伙伴来提供更好的协作和适应性。在本文中,我们提出了一种基于边缘计算的工业网关,用于连接信息技术和运营技术,从而实现工业 4.0 垂直和水平集成。随后,我们设计和开发了一个工作原型来演示远程生产线维护用例,重点关注安全方面和边缘范式,以使计算资源和数据存储更接近数据源。

MTDNS:弹性 DNS 基础设施的移动目标防御

分类: 网络和互联网架构, 密码学和安全, 分布式、并行和集群计算, 新兴技术

作者: Abdullah Aydeger, Pei Zhou, Sanzida Hoque, Marco Carvalho, Engin Zeydan

发布时间: 2024-10-03

链接: http://arxiv.org/abs/2410.02254v1

摘要: 攻击者可能利用的互联网最关键组件之一是 DNS(域名系统)协议和基础设施。研究人员一直在不断开发检测和防御 DNS 攻击(特别是 DNS 洪泛攻击)的方法。然而,大多数解决方案都会丢弃数据包以进行防御,这可能会导致合法数据包被丢弃,从而使它们高度依赖于检测策略。在本文中,我们提出了 MTDNS,这是一种基于 MTD 的弹性方法,通过软件定义网络 (SDN) 交换机采用移动目标防御技术,将流量重定向到在网络功能虚拟化 (NFV) 框架下动态创建和运行的备用 DNS 服务器。所提出的方法是在测试台环境中实现的,通过将我们的 DNS 服务器作为单独的虚拟网络功能、NFV 管理器、SDN 交换机和 SDN 控制器运行来实现。实验结果表明,即使存在 DNS 洪泛攻击,MTDNS 方法在解析 DNS 查询方面也能实现更高的成功率,并且显着降低平均延迟。

通过腔辅助交互的通用逻辑量子光子神经网络处理器

分类: 量子物理学, 新兴技术, 光学

作者: Jasvith Raj Basani, Murphy Yuezhen Niu, Edo Waks

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.02088v1

摘要: 在玻色子模式下编码量子信息为硬件高效和容错的量子信息处理提供了一个有前途的方向。然而,使用原生光子硬件实现对玻色子自由度的高保真通用控制仍然是一个挑战。在这里,我们提出了一种使用量子光子神经网络在任意多模多光子状态上准备和执行逻辑量子操作的架构。我们方法的核心是光学非线性,它是通过三能级 Lambda 原子系统的强光-物质相互作用来实现的。这种相互作用的动力学被限制在单模子空间内,从而能够构建高保真量子门。这种非线性函数充当光子数选择性相位门,这有助于构建通用门集,并充当我们的神经网络架构中的逐元素激活函数。通过数值模拟,我们通过执行逻辑量子信息处理的关键任务来展示我们方法的多功能性。该网络能够确定性地准备各种多模多光子状态,包括基本资源状态。我们还表明该架构能够对玻色纠错码进行编码和执行逻辑运算。此外,通过调整我们架构的组件,可以构建纠错电路来保护玻色码。所提出的架构为近期量子光子处理器铺平了道路,该处理器能够实现纠错量子计算,并且可以使用当今的集成光子硬件来实现。

去中心化协作惯性跟踪

分类: 新兴技术, 分布式、并行和集群计算, 网络和互联网架构, 信号处理

作者: Alpha Diallo, Benoit Garbinato

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01982v1

摘要: 尽管人们大部分时间都在室内度过,但全球定位系统 (GPS) 等室外跟踪系统主要用于基于位置的服务。这些系统在户外准确、易于使用,并且可以在每个移动设备上自主运行。相比之下,室内跟踪系统(ITS)缺乏标准化,并且通常难以操作,因为它们需要昂贵的基础设施。在本文中,我们提出了一种室内跟踪算法,该算法使用从大多数移动设备中嵌入的惯性传感器收集的数据。在这种情况下,移动设备可以自主估计其位置,从而消除了部署和维护复杂且分散的硬件基础设施的负担。此外,这些设备还通过使用蓝牙等无线通信与附近其他设备匿名交换数据来进行协作,以纠正其位置估计中的错误。我们的协作算法依赖于低复杂度的几何操作,可以部署在任何带有商业级传感器的最新移动设备上。我们根据不同设备收集的现实数据来评估我们的解决方案。对 16 个同时移动和协作设备进行的实验表明,与独立的行人航位推测算法相比,平均准确度提高了 44%。

热力学贝叶斯推理

分类: 统计力学, 新兴技术, 机器学习

作者: Maxwell Aifer, Samuel Duffield, Kaelan Donatella, Denis Melanson, Phoebe Klett, Zach Belateche, Gavin Crooks, Antonio J. Martinez, Patrick J. Coles

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01793v1

摘要: 对复杂预测模型(例如深度神经网络)的完全贝叶斯处理将实现严格的不确定性量化和包括模型选择在内的更高级别任务的自动化。然而,对许多参数进行贝叶斯后验采样的棘手性阻碍了贝叶斯方法在最需要的地方的使用。热力学计算已成为加速机器学习中操作(例如矩阵求逆)的范例,并且基于朗之万方程到噪声物理系统动力学的映射。因此,很自然地考虑在热力学设备上实施 Langevin 采样算法。在这项工作中,我们提出了通过物理实现朗之万动力学从贝叶斯后验中采样的电子模拟设备。给出了用于采样高斯-高斯模型后验和贝叶斯逻辑回归的电路设计,并通过仿真进行了验证。结果表明,在合理的假设下,这些模型的贝叶斯后验可以通过 $\ln(d)$ 进行时间缩放采样,其中 $d$ 是维度。对于高斯-高斯模型,能源成本显示为与 $ d \ln(d)$ 成比例。这些结果凸显了使用热力学计算进行快速、节能的贝叶斯推理的潜力。

DreamGarden:通过单一提示开发游戏的设计师助手

分类: 人机交互, 人工智能, 计算和语言, 新兴技术

作者: Sam Earle, Samyak Parajuli, Andrzej Banburski-Fahey

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01791v1

摘要: 编码助手在游戏设计中的作用越来越大,既可以生成代码,也可以制定高级计划。这些工具可以在多大程度上与开发人员工作流程保持一致,以及它们的使用可以产生哪些新的人机交互模式?我们推出了 DreamGarden,这是一个能够协助在虚幻引擎中开发各种游戏环境的 AI 系统。我们方法的核心是一个 LLM 驱动的规划器,能够将单个高级提示(由人类用户提供的梦想、记忆或想象的场景)分解为分层的行动计划,然后分布在专门的子模块中,促进具体实施。该系统作为一个计划和行动的花园呈现给用户,既独立生长,又通过种子提示、修剪和反馈来响应用户干预。通过用户研究,我们探索了该系统的设计含义,为半自主助手和开放式模拟设计的未来工作绘制了路线图。

量子子集和预言机的优化

分类: 新兴技术, 计算复杂度

作者: Angelo Benoit, Sam Schwartz, Ron K. Cytron

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01775v1

摘要: 我们研究了使用 Grover 算法实现量子搜索的子集和问题的预言机。我们的工作涉及减少预言机所需的量子位、门和多控制门的数量。我们使用我们为 Qiskit 开发并已在 GitHub 上发布的 Python 库描述了将 Subset Sum 实例编译为量子预言机。然后,我们提出了保存量子位和门的技术,并通过实验证明了它们对子集和的随机实例的有效性。这些技术包括从固定宽度算术转向可变宽度算术,使用集合整数的部分和来确定特定的整数宽度,以及对集合进行排序以获得可证明最有效的部分和。我们提出了一种计算位串比较的新方法,避免了任意大的多重控制门,并且我们引入了对预言机的简单修改,允许通过 Grover 搜索近似解决子集和问题。

ADEPT-Z:帕累托最优光子张量核心的零射击自动电路拓扑搜索

分类: 新兴技术, 神经和进化计算, 光学

作者: Ziyang Jiang, Pingchuan Ma, Meng Zhang, Rena Huang, Jiaqi Gu

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01313v1

摘要: 光子张量核心 (PTC) 是基于可编程光子集成电路的光学人工智能 (AI) 加速器的重要构建模块。目前大多数PTC设计都是手动构建的,设计效率低且解决方案质量不理想。这使得满足各种硬件规格并跟上快速发展的人工智能应用程序变得充满挑战。之前的工作已经探索了基于梯度的方法来差异化地学习良好的 PTC 结构。然而,在处理多个不可微的目标和约束时,它的训练速度慢且优化困难。因此,在这项工作中,我们提出了一种更灵活、更高效的零样本多目标进化拓扑搜索框架 ADEPT-Z,该框架在更大的搜索空间中探索具有先进器件的帕累托最优 PTC 设计。可以共同优化多个目标,同时满足复杂的硬件限制。只需不到 3 小时的搜索,我们就可以获得数十种不同的帕累托最优解决方案,比之前基于梯度的方法快 100 倍,优于之前的手动设计,精度加权面积能效提高了 2 倍。 ADEPT-Z 的代码可在 https://github.com/ScopeX-ASU/ADEPT-Z 获取。

不太可能的英雄:模拟光子神经网络的非理想性作为对抗性攻击的内置防御者

分类: 新兴技术, 密码学和安全, 光学

作者: Haotian Lu, Ziang Yin, Partho Bhoumik, Sanmitra Banerjee, Krishnendu Chakrabarty, Jiaqi Gu

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01289v1

摘要: 电子光子计算系统已成为加速深度神经网络 (DNN) 工作负载的有前景的平台。主要努力集中在克服硬件非理想性并通过各种硬件/算法协同设计方法提高效率。然而,这种光子模拟混合信号人工智能硬件的对抗鲁棒性仍有待探索。尽管可以通过稳健性驱动的优化方法来减轻硬件变化,但对硬件的恶意攻击表现出与噪声不同的行为,这需要针对光学模拟硬件的定制保护方法。在这项工作中,我们重新思考了光子模拟加速器中传统上不需要的非理想性的作用,并声称它们在防御对抗性重量攻击方面具有令人惊讶的效果。受 DNN 量化和剪枝保护效果的启发,我们提出了一种针对光学模拟硬件量身定制的协同防御框架,通过攻击前的一元权重编码和攻击后的漏洞感知权重锁定来主动保护敏感权重。效率-可靠性权衡被表述为约束优化问题,并有效地离线解决,无需模型重新训练成本。使用多核光子加速器对各种 DNN 基准进行广泛评估表明,我们的框架在对抗性位翻转攻击下保持了近乎理想的片上推理精度,而内存开销仅为 <3%。我们的代码在 https://github.com/ScopeX-ASU/Unlikely_Hero 上开源。

大规模光子集成电路的自动弯曲波导布线

分类: 新兴技术, 光学

作者: Hongjian Zhou, Keren Zhu, Jiaqi Gu

发布时间: 2024-10-02

链接: http://arxiv.org/abs/2410.01260v1

摘要: 随着光子集成电路(PIC)设计的进步和​​复杂性的增加(很大程度上是由光子计算和互连的创新推动的),传统的手动物理设计过程变得越来越繁琐。现有的PIC布局自动化工具大多是原理图驱动的,这并没有减轻工程师手动波导规划和布局绘制的负担。先前对自动 PIC 布线的研究很大程度上依赖于为电路设计的现成算法,这些算法仅支持高级布线规划以最大限度地减少波导交叉。它不是为处理独特的光子学特定布线约束和指标而定制的,例如弯曲波导、弯曲、端口对齐和插入损耗。这些方法难以应对大规模 PIC,并且无法在不违反设计规则 (DRV) 的情况下生成真实的布局几何形状。这凸显了对电子光子设计自动化 (EPDA) 工具的迫切需求,这些工具可以简化现代 PIC 的物理设计。在本文中,我们首次提出了一种开源自动化 PIC 详细布线工具(称为 APR),用于为大规模实际 PIC 生成无 DRV 的 PIC 布局。 APR 具有基于网格的曲线感知 A* 引擎,具有自适应交叉插入、拥塞感知网络排序和目标以及交叉波导优化方案,所有这些都是针对 PIC 的独特属性而定制的。在大规模现实世界的光子计算核心和互连中,APR 生成了无 DRV 布局,与之前的方法相比,插入损耗降低了 14%,加速速度提高了 6.25 倍,为 EPDA 工具链的未来发展铺平了道路。我们的代码在 https://github.com/ScopeX-ASU/APR 上开源。

为 AMD AI 引擎开发 BLAS 库

分类: 分布式、并行和集群计算, 新兴技术

作者: Tristan Laan, Tiziano De Matteis

发布时间: 2024-10-01

链接: http://arxiv.org/abs/2410.00825v1

摘要: 空间(数据流)计算机架构可以减轻传统 CPU 等经典冯诺依曼架构的控制和性能开销。在机器学习 (ML) 工作负载流行的推动下,空间设备正在作为 ML 推理加速器进行营销。尽管为机器学习从业者提供了丰富的软件生态系统,但它们在其他科学领域的采用却受到陡峭的学习曲线和缺乏可重用软件的阻碍,这使得非专家无法使用它们。我们展示了我们正在进行的项目 AIEBLAS,这是一个针对 AMD AI 引擎的基本线性代数例程 (BLAS) 的开源、可扩展实现。数值例程被设计为易于重用、定制和在数据流程序中组成,利用目标设备的特性,而不需要用户深入了解底层硬件和编程模型。

构建一个简单的基于振荡器的伊辛机用于研究和教育

分类: 新兴技术

作者: Bernd Ulmann, Shrish Roy

发布时间: 2024-10-01

链接: http://arxiv.org/abs/2410.00523v1

摘要: 基于振荡器的伊辛机是非冯诺依曼机,非常适合解决组合问题,而组合问题由于运行时的复杂性而在经典存储程序数字计算机上难以解决。未来可能的应用是多方面的,从量子模拟到蛋白质折叠,并且也具有很高的学术和商业兴趣。下面描述的是一种非常简单的此类机器,旨在教育和研究应用。

用于支持 V2X 的互联车辆走廊中物理-虚拟集成的数字孪生框架

分类: 机器人技术, 新兴技术, 系统与控制, 系统与控制

作者: Keshu Wu, Pei Li, Yang Cheng, Steven T. Parker, Bin Ran, David A. Noyce, Xinyue Ye

发布时间: 2024-10-01

链接: http://arxiv.org/abs/2410.00356v1

摘要: 交通网络物理系统 (T-CPS) 通过在交通系统中集成计算、通信和控制,对于提高交通安全性、可靠性和可持续性至关重要。互联车辆走廊处于这一转型的最前沿,其中蜂窝车联网 (C-V2X) 技术促进基础设施、车辆和道路用户之间的实时数据交换。然而,处理和同步来自车辆和路边设备的大量 V2X 数据仍然存在挑战,特别是在确保可扩展性、数据完整性和运营弹性方面。本文提出了 T-CPS 的数字孪生框架,该框架是根据现实世界的互联车辆走廊开发的,旨在应对这些挑战。通过利用 C-V2X 技术以及来自基础设施、车辆和道路用户的实时数据,数字孪生可以在 CARLA 模拟环境中准确复制车辆行为、信号相位和交通模式。该框架展示了物理系统和数字系统之间的高保真度,并通过大量实验确保车辆轨迹和信号相位的稳健同步。此外,数字孪生的可扩展和冗余架构增强了数据完整性,使其能够支持未来的大规模C-V2X部署。数字孪生是 T-CPS 的重要工具,可实现实时交通监控、预测和优化,从而提高交通系统的可靠性和安全性。

相关